Model Selection

Multilingual vision-language

# Multilingual vision-language

Vit Gopt 16 SigLIP2 384

SigLIP 2 vision-language model trained on WebLI dataset, supporting zero-shot image classification

Vit SO400M 16 SigLIP2 512

SigLIP 2 vision-language model trained on WebLI dataset, suitable for zero-shot image classification tasks

Vit SO400M 16 SigLIP2 384

SigLIP 2 vision-language model trained on WebLI dataset, supporting zero-shot image classification tasks.

Vit SO400M 16 SigLIP2 256

SigLIP 2 vision-language model trained on WebLI dataset, supporting zero-shot image classification

Vit SO400M 14 SigLIP2 378

SigLIP 2 vision-language model trained on WebLI dataset, supporting zero-shot image classification tasks

Vit L 16 SigLIP2 512

SigLIP 2 vision-language model trained on WebLI dataset, supporting zero-shot image classification tasks

Vit L 16 SigLIP2 256

SigLIP 2 vision-language model trained on WebLI dataset, supporting zero-shot image classification

Vit B 16 SigLIP2 512

A SigLIP 2 vision-language model trained on the WebLI dataset, supporting zero-shot image classification tasks

Vit B 16 SigLIP2 384

SigLIP 2 vision-language model trained on the WebLI dataset, suitable for zero-shot image classification tasks

Vit B 32 SigLIP2 256

SigLIP 2 vision-language model trained on WebLI dataset, supporting zero-shot image classification tasks

Vit B 16 SigLIP2 256

SigLIP 2 vision-language model trained on the WebLI dataset, supporting zero-shot image classification tasks

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase